'Bố già AI': Phản ứng của thị trường với DeepSeek là thiếu cơ sở
Yann LeCun, Giám đốc AI của Meta, cho rằng có sự hiểu lầm lớn khi so sánh các công ty Mỹ chi hàng tỷ USD vào AI với DeepSeek. Ông nhấn mạnh rằng phần lớn số tiền này được đầu tư vào cơ sở hạ tầng để suy luận, không phải để đào tạo.
Giám đốc khoa học AI của Meta, Yann Lecun, đã chia sẻ với sinh viên Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội vào tháng 12 năm 2024. Theo Business Insider, suy luận là quá trình mà các mô hình AI sử dụng kiến thức đã học để xử lý dữ liệu mới, như cách các chatbot AI như ChatGPT phản hồi yêu cầu. Số lượng yêu cầu nhiều hơn đồng nghĩa với việc cần nhiều suy luận hơn, dẫn đến chi phí tăng.
Mô hình R1 của DeepSeek đã gây chú ý với chi phí vận hành thấp hơn nhưng hiệu quả tương đương với các sản phẩm AI hàng đầu hiện nay. Theo Bernstein Research, R1 có chi phí 0,55 USD cho một triệu token, trong khi OpenAI o1 là 15 USD. R1 được đào tạo trên chip H800 của Nvidia, mã nguồn mở và rẻ hơn 96,4% so với OpenAI o1, nhưng vẫn đạt hiệu suất tương tự.
Mô hình của công ty được đào tạo trên 14,8 nghìn tỷ token với 671 tỷ tham số, lớn hơn 1,6 lần so với Llama 3.1 405B. DeepSeek R1 chỉ tốn 2,19 USD cho một triệu token đầu ra, trong khi OpenAI o1 tốn 60 USD. Thông tin này đã khiến cổ phiếu Nvidia giảm 17%, xóa sổ gần 600 tỷ giá trị công ty vào ngày 27/1, do nhà đầu tư lo ngại về chi phí cho chip AI của nhiều công ty Mỹ.
LeCun cho rằng có sự hiểu lầm trong việc so sánh chi phí giữa các mô hình như của OpenAI và DeepSeek. Việc cung cấp dịch vụ trợ lý AI cho hàng tỷ người cần rất nhiều tính toán. Khi tích hợp khả năng hiểu video, lý luận, bộ nhớ lớn và các tính năng khác vào hệ thống AI, chi phí suy luận sẽ tăng cao. Do đó, phản ứng của thị trường đối với DeepSeek là không chính xác.
Thomas Sohmers, nhà sáng lập công ty khởi nghiệp Positron về phần cứng AI, đồng ý với LeCun rằng suy luận sẽ chiếm tỷ trọng lớn hơn trong chi phí cơ sở hạ tầng AI. Ông cho biết nhu cầu và chi tiêu cho cơ sở hạ tầng sẽ tăng nhanh chóng. Trong tương lai, khi DeepSeek trở nên phổ biến hơn, công ty sẽ phải xử lý nhiều yêu cầu hơn, dẫn đến việc chi phí cho suy luận cũng sẽ tăng lên.
Trong môi trường cạnh tranh hiện nay, một số chuyên gia AI dự đoán rằng chi phí suy luận sẽ giảm theo thời gian. Tuy nhiên, giáo sư Ethan Mollick từ Trường Wharton cho rằng điều này chỉ đúng với các hệ thống quy mô nhỏ. Ông cho rằng, với mô hình như DeepSeek V3, chi phí suy luận có thể tăng cao khi phục vụ nhiều người dùng miễn phí. Trước đó, trong báo cáo tài chính ngày 29/1, Mark Zuckerberg, CEO Meta, cho biết sự xuất hiện của DeepSeek không làm ông thay đổi kế hoạch chi hàng trăm tỷ USD cho hạ tầng AI.
Ông coi các startup Trung Quốc là đối thủ mới và đang học hỏi từ họ, nhưng vẫn còn sớm để xác định nhu cầu về chip có ngừng tăng hay không, vì chúng rất quan trọng cho đào tạo AI. Zuckerberg cho biết Meta có hàng tỷ người dùng. Yann Lecun, cùng với Geoffrey Hinton và Yoshua Bengio, được gọi là "bố già AI". Lecun, người đặt nền móng cho AI hiện đại, nổi tiếng với quan điểm phản đối việc AI thống trị thế giới, trái ngược với quan điểm của những doanh nhân như Elon Musk.
DeepSeek, được Liang Wenfeng thành lập vào tháng 5 năm 2023 và có trụ sở tại Hàng Châu, Chiết Giang, thuộc sở hữu của quỹ đầu tư High-Flyer. Công ty được High-Flyer tài trợ và không có kế hoạch huy động vốn, tập trung vào phát triển công nghệ nền tảng. Tim Cook đã khen ngợi hiệu quả của DeepSeek, trong khi Hạ viện Mỹ cấm nhân viên sử dụng công cụ này vì lo ngại về việc mất dữ liệu nhạy cảm. Dù vậy, Zuckerberg vẫn cam kết chi hàng trăm tỷ USD cho AI, không bị ảnh hưởng bởi DeepSeek.
Nguồn:vnexpress.net/bo-gia-ai-phan-ung-cua-thi-truong-voi-deepseek-la-thieu-co-so-4844642.html